NLP and corpus techniques for finding formulations that facilitate scientific writing in English (Techniques de TAL et corpus pour faciliter les formulations en anglais scientifique écrit) [in French]
نویسندگان
چکیده
146 c ï¿¿ ATALA
منابع مشابه
Techniques d'apprentissage supervisé pour l'extraction d'événements TimeML en anglais et français
Identifying events from texts is an information extraction task necessary for many NLP applications. Through the TimeML specifications and TempEval challenges, it has received some attention in the last years, yet, no reference result is available for French. In this paper, we try to fill this gap by proposing several event extraction systems, combining for instance Conditional Random Fields, l...
متن کاملStratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane
RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...
متن کاملComparabilité de corpus et fouille terminologique multilingue
RÉSUMÉ. Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer ...
متن کاملClassification de questions par traduction
RÉSUMÉ. Dans cet article, nous nous intéressons à la classification de questions pour un système de questions-réponses en français. Faisant le constat d’un manque de corpus annoté en français, nous nous interrogeons sur la possibilité d’exploiter les corpus anglais existants, en utilisant des traducteurs automatiques. Nous avons mené une série d’expériences en faisant varier le sens de traducti...
متن کاملExtraction multilingue de termes à partir de leur structure morphologique
Les mØthodes d’extraction automatique de termes utilisent couramment des patrons dØcrivant la structure des termes (Ibekwe-Sanjuan et Sanjuan, 2004; Enguehard, 1992; Vergne, 2005). Dans les domaines scienti ques ou techniques comme la mØdecine (Namer, 2005), de nombreux termes appartiennent au vocabulaire savant et sont construits à partir de formants classiques grecs ou latins situØs en dØbut ...
متن کامل